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主动 测量 技术 对 非 结构 对 等 网 络 的 影响 


沙漏 

摘要 : 主动 测量 技术 已 经 成 为 研究 对 等 网 络 特征 属性 和 用 户 行为 的 一 种 重要 基础 性 手段 。 人 
术 对 对 等 网 络 的 影响 还 是 未 知 的 ， 目 前 还 缺乏 这 方面 的 详细 分 析 和 形式 化 研究 。 针 对 上 述 问题 ， 本 文 首 
介绍 了 当前 对 等 网 络 测量 的 发 展 和 现状 ， 分 析 了 当前 所 面临 的 主要 挑战 性 问题 ， 着 重 介绍 了 我 们 在 主动 
量 技术 对 非 结构 对 等 网 络 的 影响 方面 研究 工作 的 初步 进展 。 我 们 首先 提出 了 主动 测量 网 络 模型 ， 着 重 丰 
了 主动 测量 技术 对 对 等 网 络 度 分 布 的 影响 。 研 究 发 现 随 着 主动 测量 网 络 规模 的 增加 将 导致 度 分 布 的 相 变 
象 。 理 论 分 析 和 仿真 实验 证 明 一 个 小 规模 的 高 “ 度 ” 的 主动 测量 网 络 要 优 于 大 规模 的 低 “ 度 ”的 主动 测 届 
网 络 。 
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关键 词 : 对 等 网 络 ， 主 动 测量 ， 度 分 布 


准确 描述 对 等 网 络 (peer-to-peer, P2P) 拓扑 结构 的 动态 行为 ， 并 分 析 其 网 络 性 能 ， 无 论 
是 对 于 网 络 运营 商 还 是 对 等 网 络 协议 开发 者 来 说 都 具有 重要 的 参考 价值 。 而 要 完成 这 些 目 
标 ， 一 个 重要 的 基础 性 工作 就 是 精确 的 网 络 测量 


当前 面向 对 等 网 络 主要 有 主动 和 被 动 两 种 网 络 测量 方式 。 由 于 被 动 测量 仅 适 用 于 测量 流 
经 监测 点 的 对 等 网 络 流 量 , 无 法 将 监测 范围 覆盖 到 整个 对 等 网 络 , 而 且 该 方法 只 能 适用 于 流 
量 性 能 测量 ， 无 法 获取 网 络 搜索 、 路 由 、 应 用 层 传 输 等 信息 。 因 此 主动 测量 技术 有 其 不 可 符 
代 的 作用 。 粗 略 地 说 ， 主 动 测量 技术 一 般 使 用 网 络 爬 虫 (crawlenm)， 将 其 主动 加 入 对 等 网 络 ， 
获取 相关 的 网 络 特性 和 节点 属性 ， 比 如 “节点 (Peer)” 的 IP 地 址 、 端 口号 以 及 所 有 可 以 通 
过 对 等 网 络 协议 获取 的 元 数据 (metadata) 信 息 。 使 用 主动 测量 技术 ， 我 们 可 以 获得 三 类 对 等 
网 络 行为 信息 ， 即 : (1). 微观 行为 特性 ， 比 如 对 等 网 络 的 拓扑 结构 、 延 迟 、 内 容 可 用 性 、 上 
传 /下 载 比 ; (2). 拓扑 动态 行为 特征 ， 比 如 稳定 核心 覆盖 (stable core overlay， 即 顶级 拓扑 中 在 
线 时 间 超 过 特定 门限 值 的 节点 集合 ) 连 通 性 的 变化 “节点 ”会 话 时 间 和 下 载 时 间 的 分 布 、 以 
及 会 话 时 间 的 关联 性 等 ，(3). 扰动 行为 (hurm)， 即 用 户 加 入 /退出 对 等 网 络 系统 所 引起 的 动 
态 变 化 。 


终 上 所 述 , 主动 测量 技术 已 经 成 为 研究 对 等 网 络 的 拓扑 、 度 分 布 等 属性 特征 和 用 户 行为 
特征 的 一 种 重要 基础 性 手段 ， 有 着 不 可 替代 的 作用 。 但 是 主动 测量 技术 由 于 其 本 质 特征 ， 必 
然 对 原 有 对 等 网 络 的 拓扑 、 流 量 、 贡 点 的 策略 选择 以 及 用 户 行为 决策 等 产生 影响 ， 目 前 还 缺 
乏 这 方面 的 详细 分 析 和 形式 化 研究 。 因 此 ， 如 何 定量 地 评测 主动 测量 技术 的 精确 度 ， 进 而 设 
计 出 主动 测量 的 校准 算法 以 还 原 出 待 测量 的 对 等 网 络 的 更 准确 全 面 的 信息 , 是 具有 重要 研究 
意义 的 课题 。 


我 们 主要 针对 主动 测量 技术 对 对 等 网 络 的 影响 开展 了 研究 ， 具体 思路 是 : 首先 对 主动 测 
量 节 点 和 主动 测量 网 络 建 模 ; 对 其 对 对 等 网 络 的 各 方面 影响 进行 理论 分 析 ,， 即 对 主动 测量 网 
络 与 对 等 网 络 合 加 后 构成 的 混合 网 络 进行 研究 ， 获 得 形式 化 结果 ;提出 主动 测量 校准 算法 ， 
以 期 通过 校准 来 获得 对 等 网 络 更 为 真实 准确 的 信息 ; 最 后 通过 仿真 实验 和 实际 对 等 网 络 环境 
验证 模型 和 算法 的 有 效 性 。 最 终 目标 是 通过 对 主动 测量 技术 对 对 等 网 络 影 响 及 其 校准 技术 的 
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主动 测量 技术 对 非 结构 对 等 网 络 的 影响 


研究 , 建立 主动 测量 技术 的 统一 评价 标准 , 使 建立 在 主动 测量 基础 上 的 对 等 网 络 相 关 研 究 更 
加 真实 可 靠 , 并 进一步 指导 对 等 网 络 的 设计 和 优化 。 目 前 我 们 在 对 等 网 络 的 度 分 布 方面 已 获 
得 了 初步 结果 , 此 项 研究 工作 已 获得 国家 自然 科学 基金 的 支持 (国家 自然 科学 基金 面 上 项 目 ， 
编号 : 61070184)， 并 于 2011 年 启动 。 


2 “对 等 网 络 主动 测量 技术 现状 


本 节 首 先 介绍 当前 对 等 网 络 测量 的 研究 热点 , 然后 介绍 对 等 网 络 测量 领域 仍然 存在 的 挑 
战 性 问题 。 


2.1 国内 外 研究 现状 及 发 展 动态 
当前 围绕 对 等 网 络 测量 的 研究 主要 侧重 如 下 几 个 方面 : 
(1) 测量 数据 获取 方法 与 理论 建 模 


此 类 研究 工作 较 多 ， 主 要 关注 测量 方法 的 设计 (如 网 络 仆 行 器 )、 对 测量 数据 的 分 
析 、 对 理论 模型 的 仿真 和 测量 验证 ， 如 文献 [17]、[21]、[30]、[31]、[32] 等 。 萨 若 优 CS. 
Saroiu) 等 人 吕 率 先 使 用 主动 网 络 爬 虫 对 当时 最 为 流行 的 两 种 对 等 网 络 系统 Napster Fil 
Gnutella? 进 行 了 测量 研究 。 梁 建 ( 音 译 ，J. Liang) 等 人 08 1 对 Kaza ASEM PIAS AT 
进行 了 深入 的 探索 与 分 析 ， 设 计 出 专门 的 网 络 怜 虫 ， 首 次 对 Kazaa 系统 中 的 文件 污染 
状况 2 进行 了 测量 与 分 析 。 但 是 上 述 研 究 工作 都 缺乏 对 测量 的 准确 性 等 相关 问题 的 理 
论 分 析 。 只 是 在 数据 分 析 中 提 到 网 络 爬 行 器 的 设计 对 结果 的 影响 : 由 于 对 等 网 络 的 动态 
变化 ， 如 果 为 了 获得 更 为 准确 的 网 络 快照 ， 扑 行 器 仆 行 时 间 要 短 ， 但 仆 行 时 间 过 短 则 限 
制 了 爬行 的 范围 。 斯 图 泽 巴 赫 (D. Stutzbach) 和 瑞 加 亚 CR. Rejaie) 2 研究 了 Gnutella 
网 络 讨 虫 的 快照 准确 性 问题 ， 但 采用 的 手段 主要 是 实际 测量 疏 行 器 不 同 频 率 、 速 度 、 疏 
行 时 间 对 对 等 网 络 拓扑 的 影响 ， 缺 乏 理论 分 析 和 数学 模型 。 伊 斯 达 CT. Isda) 等 人 中 
指出 主动 测量 会 发 送 正确 协议 中 不 期 望 的 数据 包 , 在 大 规模 情况 下 可 能 会 引起 麻烦 ， 比 
如 造成 入 侵 检测 系统 的 报警 。 文 中 指出 了 测量 行为 可 能 成 为 异常 行为 ,会 给 系统 造成 影 
响 ， 但 是 没有 解决 对 系统 影响 的 问题 。 


= 由 此 可 以 看 出 虽然 对 对 等 网 络 已 经 进行 了 大 量 的 测量 ， 但 是 对 于 测量 过 程 的 有 效 
a 性 、 测 量 结果 的 准确 性 还 缺乏 普遍 的 关注 。 而 这 些 都 影响 了 通过 测量 数据 对 对 等 网 络 进 
行 分 析 的 准确 性 和 真实 性 。 


(2) 大 规模 对 等 网 络 中 的 取样 问题 


由 于 对 等 网 络 系统 的 大 规模 、 动 态 性 ， 直 接 获 取 全 局 行为 数据 是 不 现实 的 ， 因 此 取 
样 是 感知 这 些 系统 的 有 效 方法 。 取 样 的 关键 性 问题 在 于 如 何 获取 代表 性 的 数据 , 如何 
较 少 取样 数据 导出 全 局 的 性 质 。 


其 图 泽 巴 赫 和 瑞 加 亚 中 主要 关注 如 何 获 取 节 点 属性 (如 节点 的 度 、 链 接 带 宽 、 共 享 
文件 数 等 ) 的 代表 性 节点 ， 指 出 对 对 等 网 络 系统 的 取样 会 引入 两 方面 误差 : (一) 时 间 
《由 于 节点 不 同 的 生命 周期 ) 、《〈 二 ) 拓扑 属性 (节点 “ 度 ” 的 差异 ) 。 取 样 更 倾向 于 
高 连接 度 的 节点 。 依 照 现 有 的 研究 ， 许 多 节点 生命 期 是 很 短 的 ， 而 有 些 节点 则 会 存 


! 一 种 在 线 音乐 服务 
2 一 种 文件 共享 网 络 
? 一 款 点 对 点 文件 共享 工具 
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在 很 长 的 时 间 ， 随 着 取样 时 间 的 增加 ， 取 样 集合 会 增加 大 量 的 短 生 命 期 的 节点 。 


萨 车 优等 人 外 采用 广度 优先 或 深度 优先 的 方式 对 节点 取样 , 这 两 种 方式 都 会 对 短 生 
命 周 期 的 节点 产生 偏向 。 另外 一 种 方式 是 随机 游 走 ， 其 中 一 种 简单 的 方案 是 随机 游 走 长 
度 r， 将 终端 节点 作为 取样 点 ， 再 行走 r ， 依 次 类 推 。 虽然 此 种 方法 对 某 些 类 型 的 图 效 
果 较 好 ， 但 是 其 效率 较 低 。 按 照 图 论 ， 建 议 r >loglV|™ 7。 


车 将 对 等 网 络 映 射 为 图 ， 则 有 些 问题 可 以 借鉴 图 论 中 的 研究 结果 。 博 洛 巴 什 (B. 
Bollobis) 四、 杰 若 姆 (M. Jerrum) 定义 了 一 类 共享 某 些 属性 (如 度 分 布 等 ) 的 图 ， 
然后 采用 特定 的 随机 算法 产生 所 有 此 类 的 图 。 库 珀 CC. Cooper) 等 人 09 使 用 这 种 方法 
证 明 他 们 的 覆盖 (overlay) 重建 算法 可 以 产生 良好 属性 的 图 。 死 里 希 纳 称 尔 蒂 〈V. 
Krishnamurthy) H", WRAK (M.P.H. Stumpf) 中 等 人 从 一 个 大 的 图 中 通过 取样 产 
生出 一 个 保持 了 原始 图 属性 的 代表 性 的 子 图 。 


斯 图 泽 巴 款 和 瑞 加 亚 中 主要 关注 的 问题 是 ， 如 何 从 一 个 未 知 的 大 规模 的 动态 变化 
的 图 中 获取 无 偏 的 代表 性 节点 。 莱 斯 科 维 茨 I. Leskovec ) 等 人 中 研究 了 图 的 进化 ， 
集中 关注 稠 化 作用 (网 络 变 得 密集 )、 直 径 缩 小 〈 随 着 网 络 的 增长 ， 直 径 减 少 ) 等 属性 ， 
并 用 新 的 图 生成 器 来 解释 这 些 属性 。 他 们 的 观察 以 年 为 跨度 。 


取样 技术 影响 了 主动 测量 节点 的 选择 。 但 是 目前 还 缺乏 对 对 等 网 络 主动 测量 误差 的 
定量 理论 分 析 。 如 果 主 动 测量 技术 对 对 等 网 络 产生 了 扭曲 ， 则 即使 采用 了 无 偏 的 取样 技 
术 , 获得 的 信息 也 是 不 准确 的 。 因 此 需要 在 首先 解决 主动 测量 技术 对 对 等 网 络 的 影响 基 
础 上 ， 解 决 测量 的 误差 和 校准 问题 。 


(3) 搜索 覆盖 率 的 统计 分 析 


特 普 斯 特 拉 〈W.W. Terpstra) 等 人 2927 基 于 随机 多 图 提出 了 一 个 基于 概率 的 穷尽 
搜索 系统 发 泡 风 暴 (BubbleStorm) ， 发 泡 风暴 将 整个 系统 分 为 多 个 查询 “ 泡 ” (Query 
Bubble〉 和 数据 “ 泡 ” (Data Bubble〉， 若 两 者 有 交 又 ， 则 可 以 搜索 到 相关 的 内 容 。 此 
系统 利用 了 节点 间 带 宽 不 同 的 特性 。 察 沃 斯 (Y，Chawathe)" 、 甘 特 斯 带 斯 (C. 
Gkantsidis) 5 、 昌 (音译 ， Lv) 09 等 人 用 随机 游 走 作为 非 结构 对 等 网 络 搜 索 的 基础 ， 


r= 但 是 搜索 只 需要 在 行走 过 程 中 确定 一 个 特定 数据 的 位 置 , 而 不 关心 某 些 节点 更 倾向 被 选 
© 择 ， 这 一 点 不 同 于 无 偏 取 样 。 


(4) 建立 验证 基于 测量 的 网 络 研究 有 效 性 的 标准 


奥 尔 曼 (M. Allman) 多 提出 了 反馈 测量 (reactive measurement)， 即 将 测量 看 作 一 个 过 
程 (process) 而 不 是 一 个 现象 (event)， 要 由 前 期 测量 的 结果 来 判断 是 否 需 要 ， 如 需要 应 选 
取 何 种 下 一 步 的 测量 , 这 说 明 测量 是 一 个 动态 的 过 程 , 也 从 一 个 侧面 说 明了 需要 测量 的 
一 个 客观 评价 标准 ， 克 里 希 纳 穆 尔 带 等 人 于 2008 年 ”提出 需要 建立 验证 基于 测量 的 网 
络 研究 的 有 效 性 标准 ， 并 对 基于 测量 的 网 络 研 究 提 出 了 验证 标准 的 初步 想法 。 他 们 共 提 
出 了 4 个 问题 ， (一) 测量 的 质量 、( 二 ) 测量 的 统计 分 析 是 否 合适 、( 三 ) 建 模 方法 
的 科学 价值 、( 四 ) 验证 的 完全 性 。 实 际 上 对 等 网 络 的 测量 也 有 同样 的 问题 ， 针 对 对 等 
网 络 的 测量 也 同样 迫切 需要 建立 统一 的 评价 标准 。 为 了 建立 对 等 网 络 测量 的 统一 评价 标 
准 ， 首 先 就 需要 对 主动 测量 对 对 等 网 络 的 影响 进行 充分 的 研究 。 

因此 主动 测量 技术 对 对 等 网 络 影响 的 研究 是 关系 到 测量 准确 性 有 效 性 的 关键 性 基础 问 
题 ， 需 要 在 对 主动 测量 技术 的 本 质 特征 充分 分 析 总 结 的 基础 上 ， 建 立 主 动 测量 的 数学 模型 ， 
从 理论 上 分 析 其 对 对 等 网 络 产生 的 影响 ,获得 形式 化 的 结果 ; 在 此 基础 上 提出 主动 测量 的 校 
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准 算法 以 获得 待 测 对 等 网 络 更 为 准确 全 面 的 关键 特征 和 信息 。 
2.2 当前 研究 面临 的 问题 

当前 已 有 大 量 的 研究 人 员 对 各 种 对 等 网 络 系统 进行 了 充分 的 测量 和 分 析 , 得 出 了 很 多 有 
益 的 结果 。 但 是 当前 主动 测量 技术 还 面临 下 面 的 问题 ; 
(1) 主动 测量 技术 对 对 等 网 络 的 影响 未 知 

对 等 网 络 系统 的 规模 越 来 越 大 , 主动 测量 系统 的 规模 也 越 来 越 大 , 但 是 这 里 有 一 个 
问题 ， 就 是 主动 测量 技术 对 对 等 网 络 的 影响 是 未 知 的 。 

对 等 网 络 的 主动 测量 技术 通常 要 定制 对 等 网 络 系统 的 客户 端 , 形成 网 络 仆 虫 , 主动 
加 入 对 等 网 络 ， 获 取 相 关 的 网 络 特性 和 节点 属性 。 为 了 获取 相关 的 信息 ， 网 络 爬 虫 通 常 
遵守 对 等 网 络 的 基本 协议 , 但 是 为 了 测量 的 效率 和 准确 性 , 又 会 对 协议 进行 一 定 的 修改 。 
当 网 络 爬 虫 达到 一 定 的 规模 ， 必 然 会 对 对 等 网 络 的 特性 、 性 能 等 指标 产生 影响 ， 影 响 对 
等 网 络 中 相关 节点 、 服 务 器 的 决策 ， 进 一 步 会 影响 用 户 的 决策 。 对 等 网 络 原始 节点 的 策 


SJ 


= 略 也 会 受到 插入 对 等 网 络 的 主动 测量 节点 影响 。 虽 然 每 个 测量 节点 发 起 的 连接 都 是 清 
Pa 的 , 但 是 对 等 网 络 的 原始 节点 由 于 这 些 测量 节点 的 增加 而 导致 的 策略 等 方面 的 变化 则 是 
未 知 的 。 

N 

O 由 于 缺乏 主动 测量 技术 对 对 等 网 络 的 影响 的 研究 ， 也 就 无 从 判断 测量 过 程 的 有 效 
© 性 、 测 量 数据 的 准确 性 。 但 是 目前 还 没有 发 现 相关 的 形式 化 分 析 和 理论 研究 。 

CD 

O D 现 有 取样 技术 无 法 保证 获得 的 信息 是 正确 的 

N 

= 如 前 所 述 ， 取样 是 感知 这 些 系统 的 有 效 方法 ,由 取样 获得 的 局 部 信息 推导 出 全 局 信 


二 县 。 随 着 对 等 网 络 系统 规模 的 增加 ， 其 取样 的 规模 也 在 增加 。 取 样 技术 影响 了 主动 测量 
节点 的 选择 。 但 是 目前 还 缺乏 对 对 等 网 络 主动 测量 误差 的 定量 理论 分 析 。 如 果 主 动 测量 
技术 对 对 等 网 络 产生 了 扭曲 , 则 即使 采用 了 无 偏 的 取样 技术 , 获得 的 信息 也 是 不 正确 的 。 
因此 需要 首先 在 了 解 主动 测量 技术 对 对 等 网 络 的 影响 的 基础 上 , 解决 测量 的 误差 和 校准 
问题 ， 这 样 采用 合理 的 取样 技术 才 是 有 意义 的 。 


— 


<= (3) ”缺乏 主动 测量 技术 的 客观 评价 标准 


随 着 对 等 网 络 测量 工作 的 深入 , 有 关 测 量 的 有 效 性 验证 标准 等 问题 正 逐 步 得 到 人 们 
的 关注 。 虽然 已 经 有 了 大 量 的 测量 工作 , 但 是 对 于 测量 过 程 的 有 效 性 、 测 量 结果 的 正确 
性 等 问题 还 缺乏 客观 的 评价 标准 。 没 有 客观 的 评价 标准 ， 则 无 从 评价 测量 方法 的 优 盆 ， 
也 不 利于 测量 数据 的 共享 , 无 从 评价 测量 数据 的 质量 , 也 就 不 可 能 在 数据 处 理 阶段 采用 
合理 的 技术 手段 以 避免 或 克服 测量 数据 的 先天 缺陷 , 最 终 也 就 不 能 保证 通过 测量 对 理论 
模型 进行 验证 的 准确 性 完整 性 。 


综 上 所 述 ， 当 前 主动 测量 的 主要 问题 是 : 主动 测量 技术 对 对 等 网 络 的 影响 是 未 知 的 ; 现 
有 主动 测量 技术 不 能 获得 全 局 的 网 络 快照 ; 主动 测量 的 准确 度 还 缺乏 定量 的 理论 分 析 ， 主动 
测量 作为 研究 对 等 网 络 的 重要 手段 还 缺乏 客观 的 评价 标准 。 


3 我们 的 工作 


本 节 首 先 介绍 我 们 的 研究 路 线 , 然后 介绍 我 们 在 主动 测量 技术 对 对 等 网 络 度 分 布 的 影响 
方面 所 获得 的 初步 结 
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3.1 基本 研究 路 线 

我 们 首先 需要 研究 主动 测量 节点 的 行为 模型 和 由 主动 测量 节点 构成 的 主动 测量 网 络 的 
行为 模型 。 观 测 到 的 测量 结果 实际 上 是 待 测 对 等 网 络 与 主动 测量 网 络 的 登 加 结果 。 在 前 两 个 
研究 成 果 基 础 上 , 将 测量 结果 进行 合理 的 拆 分 , 可 获得 待 测 对 等 网 络 更 真实 准确 的 网 络 特性 
和 节点 属性 等 信息 ， 也 就 可 以 建立 主动 测量 的 校准 算法 。 


基体 研究 包括 以 下 几 个 方面 ; 


-主动 测量 节点 的 研究 ， 包 括 主动 测量 节点 的 属性 模型 、 行 为 模型 等 ， 重 点 在 于 其 与 
正常 对 等 网 络 节点 的 比较 ; 
-主动 测量 网 络 的 研究 ， 包 括 主动 测量 网 络 模型 、 其 本 质 特征 、 与 待 测 的 对 等 网 络 的 
异同 等 
-主动 测量 对 对 等 网 络 的 影响 ， 分 析 对 等 网 络 受 主动 测量 影响 的 属性 和 影响 的 方式 、 
建立 主动 测量 网 络 与 对 等 网 络 的 炙 加 模型 及 其 形式 化 结果 ; 
— -~ 主动 测量 校准 算法 及 其 验证 ， 将 测量 结果 进行 合理 拆 分 ， 获 得 待 测 对 等 网 络 的 真实 
> 准确 网 络 特性 等 信息 ， 并 在 仿真 和 实际 网 络 环境 中 验证 模型 和 算法 的 有 效 性 。 


3.2 主动 测量 技术 对 对 等 网 络 度 分 布 的 影响 


度 分 布 是 刻画 对 等 网 络 的 一 个 重要 特性 , 因此 我 们 首先 研究 主动 测量 技术 对 非 结 构 对 等 
网 络 的 度 分 布 的 影响 ， 以 此 作为 本 课题 研究 的 起 点 。 首 先 定义 节点 1 的 度 ki 为 与 该 节点 连接 
的 其 它 节 点 的 数目 。 网 络 中 所 有 节点 i 的 度 ki 的 平均 值 称 为 网 络 的 平均 度 ， 记 为 (k) 。 网 络 
中 节点 的 度 的 分 布 情况 可 用 分 布 函数 p(k) 来 描述 。 p(k) 为 网 络 中 度 为 的 节点 占 所 有 贡 点 
数 的 比例 ， 也 就 是 随机 选取 的 一 个 节点 的 度 为 k 的 概率 。 


= 


KEL FEAR HAE E KER BABE OD As AREER p(k) ~k RHR. WR A PR 
f(x) 其 有 如 下 性 质 : 对 任意 给 定常 数 a， 存 在 常数 b 使 得 了 (ax)=bf (x) ， 则 称 该 函数 是 “无 
标 度 ” 的 。 


窜 函 数 是 具有 这 种 性 质 的 唯一 函数 。 这 表明 具有 短 律 度 分 布 的 网 络 没有 明显 的 特征 标 
度 ， 此 类 网 络 称 为 无 标 度 网 络 。 在 一 个 大 规模 的 无 标 度 网 络 中 ， 绝 大 部 分 的 节点 的 度 相 对 很 
低 ， 但 存在 少量 的 度 的 数值 相对 很 高 的 节点 。 因 此 ， 无 标 度 网 络 是 非 均匀 的 ， 而 那些 少量 的 
度 相 对 很 高 的 节点 称 为 网 络 的 “中 心 节 点 ”。 


对 对 等 网 络 的 主动 测量 的 整体 行为 可 以 看 作 是 待 测量 的 对 等 网 络 与 测量 网 络 的 县 加 ; 


Gm=Go + Ga 


中 ; Gm 为 测量 所 得 的 网 络 , EID GA EE T SE ye aT SCH TEL > P E; 
Go 为 待 测 的 对 等 网 络 ; 
Ga 为 主动 测量 网 络 。 

3.2.1 待 测 对 等 网 络 Go 的 生成 模型 


许多 研究 表明 非 结 构 对 等 网 络 符合 无 标 度 特性 ， 其 度 分 布 可 以 用 p(k) ~ ak 一 来 描述 。 
因此 我 们 可 以 采用 巴 拉 巴 斯 -阿尔 伯 特 模型 (Barabasi-Albert model, BA model, 即 BA #24)?! 
来 产生 Go 的 模型 。 首 先是 实际 网 络 的 增长 (Growthb) 特 性 ， 即 网 络 是 开放 的 ， 网 络 规模 并 非 


NI 
4 
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固定 而 是 不 断 增 大 的 。 其 次 ， 实 际 网 络 具有 优先 连接 (Preferential Attachment) 特 性 ， 即 新 的 
节点 更 倾向 于 与 那些 具有 较 高 连接 度 的 “大 ”的 节点 相连 接 。 基 于 网 络 的 增长 和 优先 连接 特 
FE, BA 无 标 度 网 络 模型 的 构造 算法 如 下 [3 


(1) 网 络 规模 增长 : 从 一 个 具有 mo 个 节点 的 网 络 开始 , 每 次 引入 一 个 新 的 节点 , 并 将 该 

节点 连接 到 m 个 已 经 存在 的 节点 上 。 

(D TANIER: 一 个 新 节点 与 一 个 已 经 存在 的 节点 相连 接 的 概率 Mi 与 节点 站 的 度 态 
之 间 满 足以 下 关系 : 


ki 
Tiki 

在 经 过 t 步 后 , 这 种 算法 产生 一 个 有 N=t+mo 个 节点 ，m 条 边 的 网 络 。 当 N 充分 大 时 ， 
网 络 的 度 分 布 函数 可 由 指数 为 -3 的 索 律 函数 描述 ， 即 网 络 中 连接 度 为 K 的 节点 的 概率 与 k™ 
成 正比 ， 且 网 络 的 平均 度 为 2mo 。 


当 t 一 co 时 ， 得 到 不 依赖 于 时 间 的 震 律 度 分 布 : 


Ii 


Po(k)=2mĝk™” 
3.2.2 混合 网 络 Gm 的 生成 模型 
首先 分 析 主 动 测量 网 络 Go 在 对 对 等 网 络 度 分 布 的 影响 方面 所 具有 的 特性 : 
- 为 了 提高 测量 获得 的 网 络 快照 的 准确 性 ， 主 动 测量 的 时 间 不 能 持续 太 长 ; 
一 因为 主动 测量 的 时 间 不 能 持续 太 长 , 所 以 主动 测量 节点 的 生命 周期 也 不 会 持续 太 长 ， 
但 是 在 主动 测量 时 间 周 期 内 ， 新 增 的 节点 应 该 主要 是 主动 测量 节点 ; 
— 由 于 对 等 网 络 动态 化 、 大 规模 特性 ， 主 动 测量 节点 只 占 整个 对 等 网 络 中 的 一 小 部 分 ; 
一 主动 测量 节点 的 度 一 般 都 高 于 正常 对 等 网 络 节 点 的 度 ， 只 有 这 样 测量 节点 才 可 以 获 
得 尽 可 能 多 的 信息 ， 但 在 测量 周期 内 ， 新 增 连 接应 主要 是 测量 节点 与 已 存在 的 节点 
的 连接 ; 
一 主动 测量 节点 通常 只 能 获得 当前 对 等 网 络 局 部 信息 ， 并 向 其 中 部 分 节点 发 起 连接 。 


考虑 到 主动 测量 网 络 Ga 的 特性 ， 所 提出 的 混合 网 络 Gm 的 生成 模型 ， 主 要 是 模拟 
主动 测量 的 过 程 。 设 已 知 待 测 对 等 网 络 共有 N 个 节点 ，M 个 连接 ， 主 动 测量 获得 的 本 
地 对 等 网 络 规模 为 y ， 则 可 通过 重复 下 面 的 步骤 建立 混合 网 络 Gm 的 生成 模型 ; 


E SRI 建立 本 地 对 等 网 络 。 随机 或 采用 某 种 取样 算法 从 整个 对 等 网 络 中 选取 7y 个 
节点 ， 这 yy 个 节点 对 主动 测量 节点 来 说 构成 了 一 个 本 地 对 等 网 络 ， 记 为 4; 


m ”步骤 2: 增加 节点 。 以 概率 P 在 本 地 对 等 网 络 4 中 增加 一 个 有 mi 个 连接 的 新 节点 。 
王 何 一 个 本 地 网 络 中 已 存在 的 节点 i 在 时 刻 t 与 之 发 生 连接 的 概率 174[ki()] 正 比 
于 节点 1 的 平均 度 ， 即 : 


=~ 


yk) 
N+pt Yjeski) 
m 步骤 3: 增加 连接 。 以 概率 g 在 本 地 网 络 中 已 存在 节点 之 间 增 加 mi 个 新 连接 。 新 连 
接 一 端 是 随机 选择 的 ， 另 一 端 是 以 概率 174|[ki(t)] 选 择 的 ; 


m ”步骤 4: 移 除 连接 。 以 概率 1-P-g 在 本 地 网 络 中 移 除 ms 个 连接 , 这些 连 接 都 是 在 


ITa [ki (t)| = 
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本 地 网 络 中 随机 选择 的 。 


XE, O< p<l, 0<qg<1，mli<y<N+pt m, <mo 


步 又 1 可 以 采用 多 种 方法 实现 由 全 局 对 等 网 络 到 本 地 局 部 网 络 的 映射 ; 步骤 2 对 应 于 增 
加 一 个 新 的 测量 节点 ， 因 为 在 主动 测量 期 间 ， 新 增加 的 节点 以 测量 节点 为 主 ， 因 此 这 个 模型 
里 主要 考虑 测量 节点 ; 步骤 3 对 应 于 增加 测量 节点 和 正常 对 等 网 络 节 点 之 间 的 连接 , 这 些 连 
接 包 括 测 量 节 点 与 正常 节点 之 间 的 连接 和 正常 节点 之 间 的 连接 。 由 于 节点 性 能 的 限制 , 系统 
在 单位 时 间 内 只 能 增加 有 限 的 连接 ， 因 此 我 们 设置 上 述 两 个 操作 的 参数 都 是 mi 。 最 后 一 步 
模拟 了 对 等 网 络 的 动态 特性 ， 即 单位 时 间 内 会 有 一 定 的 测量 节点 和 正常 节点 之 间断 开 连 接 。 


当然 这 里 的 对 等 网 络 模型 和 主动 测量 网 络 与 对 等 网 络 的 车 加 模型 都 是 相对 比较 简单 的 ， 
随 着 研究 的 深入 会 逐步 采用 更 复杂 的 模型 以 接近 实际 系统 。 


3.2.3 混合 网 络 Gm 的 度 分 布 

本 节 利 用 Barabasi_Albert( 巴 拉巴 斯 -阿尔 伯 特 ) 连 续 域 (mean field) 理 论 分 析 混 合 网 络 与 
待 测 网 络 在 度 分 布 方面 的 差异 。 由 上 节 可 知 ， 在 每 个 时 间 步 有 mi <y< N+ pt. Fe, 我们 
可 以 分 别 考虑 两 个 极端 情况 : 


(D y=N+pt 
在 这 种 情况 下 ， 本 地 对 等 网 络 就 是 整个 对 等 网 络 网 络 ， 其 度 分 布 为 : 


pm, -3 x ak™ 
Pissa ak 


此 处 (ko) 是 待 测 对 等 网 络 “ 度 ”的 平均 值 。 


这 说 明 在 这 种 情况 下 混合 网 络 仍然 是 一 个 无 标 度 网 络 , 即 如 果 主 动 测量 的 规模 较 小 ,并 
日 主动 测量 网 络 可 以 获得 整个 对 等 网 络 的 信息 。 主 动 测量 只 影响 系数 a， 而 不 影响 震 指 数 b。 


(2) y=m, 
此 时 的 度 分 布 为 : 
1 p -Pk Pk 


-1 + 2 
P(k) =——e%e™ we”™ , @=pt 4 
am, m,-1 


此 时 混合 网 络 已 符合 指数 分 布 。 

从 上 述 两 个 极端 的 例子 我 们 可 以 看 出 ， 如 果 y<=mi , 则 Palk) 接近 指数 分 布 ， 如 果 
yax N+pt, U P (k) 接近 无 标 度 分 布 ; m <y<(N + pt), 1 Pick) 从 指数 分 布 过 渡 到 无 
标 度 分 布 。 如 果 本 地 对 等 网 络 规模 足够 大 , 主动 测量 节点 主要 与 已 存在 的 正常 对 等 网 络 节 点 
相连 ， 混 合 网 络 仍然 保持 无 标 度 网 络 ， 则 主动 测量 网 络 对 待 测 对 等 网 络 影响 较 小 ; 但 是 如 果 
本 地 对 等 网 络 规模 较 小 ， 则 混合 网 络 将 过 渡 到 指数 分 布 , 这 意味 着 主动 测量 网 络 对 待 测 对 等 
网 络 影响 较 大 。 因 此 主动 测量 网 络 应 该 获得 尽 可 能 多 的 待 测 对 等 网 络 节点 的 信息 。 

3.2.4 仿真 实验 


我 们 主要 采用 MATLAB 仿真 了 待 测 网 络 Go 和 混合 网 络 Gm 的 生成 模型 .采用 如 下 标识 : 
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Py(k) FI Pa (k) OP BF Py» Pn 表示 ; Go 表示 为 Go(No,mo)， 其 中 No 是 Go 网 络 节点 总 数 ， 
mo 是 每 个 时 间 步 增加 的 连接 数 ，Gm 表示 为 Gn(CNnnmamap,gqGo)， 其 中 mn 是 Gm 网 络 节 
点 总 数 ，m 是 每 个 时 间 步 增加 的 连接 数 ，ms 是 每 个 时 间 步 移 除 的 连接 数 ，p 是 增加 节点 的 
WE, q 是 增加 连接 的 概率 ，G 是 初始 待 测 对 等 网 络 。 我们 仿真 Gu 的 规模 从 2000 到 20000. 

因为 结果 相似 ， 下 面 只 用 No = 5000 为 例 说 明 。 


(1) Py AIP, RUBE 


Go(5000,5) 和 Gm(5010, 10, 1, 0.6, 0.3, 


10° 


G0) 的 度 分 布 如 图 1 所 示 ，X 轴 表 示 节 点 
的 度 ，Y 轴 表 示 度 分 布 〈 双 对 数 坐 标 )。 g 1 
由 图 1 可 知 其 度 分 布 接近 一 条 直线 , 所 以 


两 个 网 络 的 度 分 布 都 符合 无 标 度 分 布 ,两 10" 
者 没有 明显 的 差异 , 说 明 小 规模 主动 测量 
网 络 对 对 等 网 络 的 影响 较 少 。 10° Depo 
10° 101 40° 

(2) Nm Xt Pn 的 影响 k 

随 着 N, 的 增加 ， 导 致 系数 a ARG ”图 1。 AUPE EA) Ait Po A IS BE A Pm 
数 b 急剧 下 降 ， 而 产生 相 变 现象 (图 2)， 此 时 N =5070 。 如 图 3 所 示 ， 当 Nn 超过 5070 
的 时 候 ， 其 度 分 布 已 经 严重 偏离 了 无 标 度 分 布 。 我 们 观察 到 即使 很 小 规模 的 主动 测量 网 络 
AWER) 就 会 对 度 分 布 产生 严重 的 影响 〈 表 1)。 因 此 在 设计 主动 测量 网 络 的 时 候 ， 应 该 


采用 小 规模 高 “ 度 ” 的 测量 节点 而 不 是 大 规模 的 低 “ 度 ”的 测量 节点 
表 1 当 发 生 相 变 时 No 和 Ni 值 


7080 
8090 
9100 
101000 


1.0 0 1 Í L 
5000 5050 5100 5150 5200 5000 5050 5100 5150 5200 
Nm Nm 


图 2。 Nm 对 系数 a PAGAL b 的 影响 ，X 轴 表 示 Nm 从 5000 到 5200. .Y 轴 分 别 是 a M b. 
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P(k) 


图 3. Pm: Go(5000, 5); Gm(5130,10,1,0.6,0.3,Go) 


4 总 结 与 未 来 工作 


本 文 首先 介绍 了 对 等 网 络 测量 的 发 展 和 现状 , 指出 了 当前 对 等 网 络 测量 的 主要 问题 是 主 


动 测量 技术 对 对 等 网 络 的 影响 是 未 知 的 , 由 此 影响 了 对 对 等 网 络 测量 结果 的 判断 和 校正 , 不 
利于 建立 统一 的 测量 评价 标准 。 然 后 介绍 了 我 们 在 主动 测量 技术 对 对 等 网 络 影响 方面 的 工 


Ves 提出 了 基本 的 研究 路 线 ; 对 主动 测量 技术 对 对 等 网 络 度 分 布 的 影响 获得 了 初步 结果 。 下 
一 步 工 作 将 进一步 研究 主动 测量 技术 对 对 等 网 络 其 他 方面 的 特性 的 影响 , 并 进而 提出 主动 测 
量 的 校正 算法 ， 以 获得 正确 真实 的 测量 结果 ， 提 出 统一 的 测量 评价 标准 。 
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